#entropía cruzada

¿Qué controla realmente la norma de pesos en Grokking?

Descubre cómo la escala de logits, y no la norma de pesos, determina el retraso en Grokking. Un estudio revela que el 97% del efecto depende de la saturación

2026-06-18 · 3 min

Pérdida de Divergencia Kullback-Leibler Generalizada

Descubre cómo la nueva pérdida GKL mejora la robustez adversarial y la destilación de conocimiento, logrando resultados líderes en RobustBench.

2026-06-18 · 2 min

El programa sigue ahí: Ley de conservación en descubrimiento

El descubrimiento de programas no es imposible, tiene un costo medible: el conocimiento estructural se intercambia directamente con el esfuerzo de búsqueda. Conoce el teorema.

2026-06-15 · 1 min

Desacuerdo entre modelos como señal de corrección sin etiquetas

Descubre cómo el desacuerdo entre modelos de IA permite detectar errores sin etiquetas. Un método simple y sin entrenamiento que supera a las técnicas tradicionales.

2026-06-12 · 2 min

Análisis de campo medio de auto-atención multicabezal bajo entropía cruzada

Explora un nuevo marco teórico de campo medio para la auto-atención multicabezal, estableciendo condiciones de convergencia y estabilidad bajo entrenamiento con entropía cruzada.

2026-06-10 · 2 min

Investigando la pérdida de histograma en regresión

¿Por qué la pérdida de histograma mejora la regresión? Investigamos sus beneficios: optimización, no información extra. Aplicable sin costoso ajuste de hiperparámetros.

2026-06-09 · 2 min